扩增子统计绘图5火山图:差异OTU数量及变化规律
点击上方蓝色「宏基因组」关注我们!专业干货每日推送!
写在前面
优秀的作品都有三部分曲,如骇客帝国、教父、指环王等。
扩增子系列课程也分为三部曲:
第一部《扩增子图表解读》:加速大家对同行文章的解读能力。
第二部《扩增子分析解读》:学习数据分析的基本思路和流程。
第三部《扩增子统计绘图》:即是对结果进行可视和统计检验,达到出版级的图表结果。
《扩增子统计绘图》系列文章介绍
《扩增子统计绘图》是之前发布的《扩增子图表解读》和《扩增子分析解读》的进阶篇,是在大家可以看懂文献图表,并能开展标准扩增子分析的基础上,进行结果的统计与可视化。其章节设计与《扩增子图表解读》对应,为八节课八种常用图形(箱线图、散点图、热图、曼哈顿图、火山图、维恩图、三元图和网络图),基本满足文章常用的图片种类需求。
也适合对公司标准化分析返回结果的进一步统计、可视化及美化,达到出版级别,冲击高分文章。
本部分练习所需文件位于百度网盘,链接:http://pan.baidu.com/s/1hs1PXcw 密码:y33d。
1箱线图:Alpha多样性
2散点图:Beta多样性,PCoA, CCA
3热图:差异菌、OTU及功能
4曼哈顿图:差异OTU或Taxonomy
本节需要在”3热图:差异菌、OTU及功能”基础上继续运行
5火山图:差异OTU数量及变化规律
# 绘制火山图
if (max(x$logFC)>4){x[x$logFC>4,]$logFC = 4} # norm x axis
if (min(x$logFC)< -4){x[x$logFC< -4,]$logFC = -4} # norm x axis
x$level = as.factor(ifelse(x$sig==1, "enriched",ifelse(x$sig==-1, "depleted","nosig")))
# Volcanol plot of fold change vs abundance plot
p = ggplot(x, aes(x=logFC, y=logCPM, color=level)) + geom_point() +
scale_colour_manual(values=c("green","red","grey"))+ xlim(-4, 4)+
labs(x="log2(fold change)",y="log2(count per million)", title=paste("OE vs WT", sep=" "))
p
ggsave(file=paste("vol_otu.pdf", sep=""), p, width = 8, height = 5)
ggsave(file=paste("vol_otu.png", sep=""), p, width = 8, height = 5)
图1. 火山图展示差异OTU数量及变化规律;横轴为相对丰度变化的差异倍数,纵轴为相对丰度取Log2对数值;红色点为显著上调的OTU,绿色为显著下调的OTU,灰色为不显著变化的OTU;
详细的图片讲解,可参考5火山图:差异OTU数量及变化规律
这也是目前认为公认的样式,ggplot2允许添加更多信息,如表达丰度和物种信息;
物种信息的处理,需要完成上一节4曼哈顿图:差异OTU或Taxonomy 中的代码完成对物种信息的格式处理。
# 绘制有物种信息和相对丰度的火山图
p = ggplot(x, aes(x=logFC, y=logCPM, color=level, size=logCPM, shape=tax)) + geom_point() +
scale_colour_manual(values=c("red","green","grey"))+ xlim(-4, 4)+
labs(x="log2(fold change)",y="log2(count per million)", title=paste("OE vs WT", sep=" "))
p
图2. 火山图展示差异OTU数量及变化规律,除上下调外,大小代表相对丰度的对数值,点的形状代表物种的门分类信息。
想了解更多宏基因组、16S分析相关文章,
快关注“宏基因组”公众号,干货第一时间推送。
系统学习生物信息,快关注“生信宝典”,
那里有几千志同道合的小伙伴一起学习。